首页> 外文OA文献 >Overfitting Bayesian Mixtures of Factor Analyzers with an Unknown Number of Components
【2h】

Overfitting Bayesian Mixtures of Factor Analyzers with an Unknown Number of Components

机译:过度拟合具有未知数的因子分析器的贝叶斯混合   组件

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

Recent advances on overfitting Bayesian mixture models provide a solid andstraightforward approach for inferring the underlying number of clusters andmodel parameters in heterogeneous data. In this study we demonstrate theapplicability of such a framework in clustering multivariate continuous datawith possibly complex covariance structure. For this purpose an overfittingmixture of factor analyzers is introduced, assuming that the number of factorsis fixed. A Markov chain Monte Carlo (MCMC) sampler combined with a priorparallel tempering scheme is used to estimate the posterior distribution ofmodel parameters. The optimal number of factors is estimated using informationcriteria. Identifiability issues related to the label switching problem aredealt by post-processing the simulated MCMC sample by relabelling algorithms.The method is benchmarked against state-of-the-art software for maximumlikelihood estimation of mixtures of factor analyzers and standard mixtures ofmultivariate Gaussian distributions using an extensive simulation study.Finally, the applicability of the method is illustrated in publicly availabledata.
机译:贝叶斯混合模型过拟合的最新进展为推断异构数据中潜在的簇数和模型参数提供了坚实而直接的方法。在这项研究中,我们证明了这种框架在聚类可能具有复杂协方差结构的多变量连续数据中的适用性。为此,在假定因子数量固定的情况下,引入了因子分析器的过拟合混合物。马尔可夫链蒙特卡洛(MCMC)采样器与先验并行回火方案相结合,用于估计模型参数的后验分布。使用信息标准估计最佳因素数。通过重新标记算法对模拟的MCMC样本进行后处理,可以处理与标签切换问题相关的可识别性问题。该方法以最新软件为基准,用于使用最后,在公开数据中说明了该方法的适用性。

著录项

  • 作者

    Papastamoulis, Panagiotis;

  • 作者单位
  • 年度 2017
  • 总页数
  • 原文格式 PDF
  • 正文语种
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号